Acest mecanism de AI a făcut o descoperire importantă despre proteine. Ce înseamnă asta și cum ne afectează

de: Ozana Mazilu
01 12. 2020

DeepMind, deținut de compania Alphabet, este cel mai bine cunoscută pentru construirea algoritmului de AI care a învins un jucător Go de talie mondială. Compania a anunțat acum o altă descoperire, poate mai vitală.

Ca parte a activității sale pentru a 14th Critical Assessment of Protein Structure Predictionsau CASP, AlphaFold 2 AI de la DeepMind a demonstrat că poate ghici modul în care anumite proteine ​​se vor plia, cu o precizie surprinzătoare. În unele cazuri, rezultatele au fost percepute ca fiind „competitive” cu datele reale, experimentale.

„Ne-am blocat în această problemă – cum se protejează proteinele – de aproape 50 de ani”, a spus profesorul John Moult, președinte și cofondator CASP, într-o postare pe blogul DeepMind. „A vedea cum DeepMind produce o soluție pentru acest lucru, după ce am lucrat personal la această problemă atât de mult timp și după atâtea opriri și începuturi, întrebarea dacă vom ajunge vreodată acolo, este o ipoteză foarte importantă” explică acesta.

Cercetătorii și entuziaștii de pe internet au întâmpinat veștile cu entuziasm, unii spunând că AlphaFold a descifrat „rezolvarea problemei proteinelor”.

Dar ce înseamnă asta, mai exact, pentru noi? Și cum putem beneficia de asta?

Pentru a începe să răspundem la aceste întrebări, trebuie să aruncăm o privire mai atentă asupra proteinelor în sine. Așa cum ar fi putut spune profesorul tău de biologie, proteinele sunt elementele de bază ale vieții, responsabile de nenumărate funcții în interiorul și în afara corpului uman.

Fiecare începe ca o serie de aminoacizi strânși împreună într-un lanț, dar nu durează mult – uneori doar milisecunde – înainte ca lucrurile să înceapă să se complice. Unele părți ale lanțului de aminoacizi se răsucesc în spirale. Alții se îndoaie pe ei înșiși ca niște „foi”.

În scurt timp, aceste spirale și foi se unesc și se contorsionează în structura finală a unei proteine ​​și asta îi conferă unei proteine ​​capacitatea de a îndeplini sarcini specifice, cum ar fi transportarea oxigenului prin corpul tău sau întărirea structurii oaselor tale.

Cu alte cuvinte, forma este totul, iar cercetătorii au petrecut zeci de ani încercând să găsească o modalitate de a determina structura finală pliată a unei proteine, bazată exclusiv pe aminoacizii care alcătuiesc coloana vertebrală.

Aici intervine CASP – ce a descoperit algoritmul AI


Începând din 1994, programul a servit ca punct central pentru echipele din întreaga lume care lucrează pentru a rezolva această problemă a proteinelor, cu ingeniozitate de calcul. Regulile sunt destul de simple: la fiecare doi ani, organizatorii selectează o serie de proteine ​​țintă dintr-o serie de lucrări ale căror structuri au fost determinate experimental, dar nu au fost încă publicate. Cercetătorii au la dispoziție câteva luni pentru a-și regla sistemele și a-și face predicțiile, care sunt apoi evaluate de experți în domeniu, timp de aproximativ o lună după închiderea depunerilor.

În timp ce CASP funcționează de 26 de ani, în ultimii câțiva ani comunitatea științifică a reușit să facă pași importanți în puterea de calcul și învățarea automată.

Cum a funcționat AI în acest demers

În cazul DeepMind, acest lucru a presupus instruirea modelului de predicție al AlphaFold 2 pe aproximativ 170.000 de structuri proteice cunoscute, împreună cu un număr mare de secvențe proteice ale căror structuri 3D nu au fost încă determinate. Aceste date de testare, spune echipa, sunt destul de similare cu ceea ce a folosit în 2018, când sistemul original AlphaFold a obținut note de top în timpul CASP 13. La acea vreme, organizatorii au salutat „progresul fără precedent al DeepMind în capacitatea metodelor de calcul de a prezice structura proteinelor”.

Acestea fiind spuse, echipa a făcut unele modificări notabile în abordarea sa de AI – nu au publicat încă o lucrare completă, dar ipotezele CASP 14 evidențiază unele dintre modificările lor. Și dincolo de asta, DeepMind s-a bazat, de asemenea, pe aproximativ 128 de nuclee TPUv3 bazate pe cloud-ul Google, care i-au dat, în cele din urmă, lui AlphaFold 2 capacitatea de a determina cu exactitate structura unei proteine ​​în doar câteva zile, dacă nu chiar mai devreme – New York Times notează că, în unele cazuri, predicțiile pot fi generate în câteva ore.

Pe de altă parte, DeepMind spune că nu a rezolvat pe deplin problema proteinelor, dar este din ce în ce mai aproape decât mulți credeau că e posibil

Toate acestea sună impresionant – și sunt, cu siguranță – dar mai sunt multe lucruri de făcut. În ansamblu, rezultatele AlphaFold au reprezentat o îmbunătățire a preciziei în comparație cu anii trecuți și, așa cum am menționat, unele dintre predicțiile DeepMind au fost suficient de exacte pentru a rivaliza cu rezultatele experimentale la nivel atomic.

Pe măsură ce studiile DeepMind continuă, vom începe să vedem dimensiunea completă a predicției exacte a proteinelor – deocamdată, juriul pare să afle ce beneficii practice ne-am putea aștepta să vedem pe termen scurt.

Astfel, compania subliniază potențialele progrese în sustenabilitate și în proiectarea medicamentelor ca rezultat al cercetării sale privind plierea proteinelor, deși nu a elaborat detalii.

Între timp, Janet Thornton, biolog structural la Laboratorul European de Biologie Moleculară – Institutul European de Bioinformatică, a declarat pentru Nature că speră că acest pas important ar putea explica funcțiile a mii de proteine nerezolvate care funcționează în corpul uman. Cercetătorii ar putea astfel să analizeze o sursă de date despre structura proteinelor noi pentru a investiga și a testa noi funcții.